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© PROCEDE DE SYNCHRONISATION SPATIALE D'UNE IMAGE 
D'IDENTIFICATION DE LA SYNTAXE D'UNE SEQUENCE VIDEO. 



VIDEO CODEE NUMERIQUEMENT ET/OU 



(57) {.'invention concerne un procede de synchronisation 
de la position spatiale d'une image video (IM) pour retrouver 
la position d'une grille initiate (Gl) de codage numerique, par 
blocs de codage de ladite image (IM), caracte>ise en ce qu'il 
met en oeuvre les etapes suivantes: 

a) deplacer selon la direction des lignes de rimage (IM) 
et/ ou selon la direction perpendiculaire aux lignes de I'ima- 
ge (IM), une grille d'analyse (GA) constitute de dits blocs de 
codage et correspondant a au moins une partie de Pimage 
(IM); 

b) determiner & chaque position de la grille d'analyse 
(GA), les coefficients transformes Fu, v de chaque bloc de 
la grille d'analyse (GA), par une transformee en cosinus dis- 
crete (TCD); et calculer pour chaque position de la grille 
d'analyse (GA), un parametre d'activite AM, ES) represen- 
tatif de I'activite de rimage; 

c) determiner la position de la grille d'analyse (GA) pour 
laquelle ledit parametre d'activite (AM, ES) presente une va- 
leur minimale. 
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SEQU6NCEV.0EO pour ^ un proce d, de 

. . .,..1 ,! "t„ «n a ,ia,e d'une image video, pour retrouve, la 

de nouve.es perspertives dans ies « * J^T^ » 
product, rarcnivage et ,a ^^%T1 g T«n de deb*. 
cet,e -no^a i^ - — de ^ ^ ^ ^ 

notamment JPEG, CCin n^o , differentes operations. 

qu an«e dedonn.es gener.es f "^^SS-n-T de .e,s 
s Plusieurs equipements mtegrem 

.gorges de codage : ^^^uXf^nT Z 
production e. encoders pour la d,«us,on. La general, sat, ^ 
mpligue souven, une sucoession de oes operabon. u ™e « En 
ces systemes n'est pas sans effete sur Ies s^aux e ba 
!0 effeJes precedes a reducuon de debit -*™^^T^U^ 
inboduisen, des degradations liees aux algonthmes ^ P de 
transform^ en oosinus discrete par bloc . esbmab^ i« P 
m0U vemen,s. prediction, etc. De * 
numeriques et analogiques dans une ^ s . ajouten « aux 

25 audiovisuels infoduit de nouvel.es « tions son, 

degradations cumulees dues aux °" " , intarferen > 

pnncipalemen, dues aux dephasages -P-"**^ ^das de 
avec le formatage des donnees mis en oeuvr par Ies 
compression. En effet. Ies recommendations refabve aux t^b «^ ^ 
30 codage on, spec*, un codage selon legue! I ^ 
gnlle de codage presentant des blocs de 

Lenten, different pour Ies images d'une meme prtdidion 
ood.es sans prediction (Intra ^^J^^^ (B). 
Monodirectionnelle (P) et .mages codees avec pe rmettan, 
„ II est done utile de pouvoir disposer d un proceoe p 

de retrouver la synchronisa,ion correspondent a la grille -ale de codage 



numerique. 
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En outre, un tel procede est egalement utile pour permettre 
d'effectuer des tests de performance des systemes. 

Afin d'evaluer ('impact d'un systeme sur le signal original et 
pour permettre de tester ses performances, il est en effet connu d'effectuer 
5 une comparaison entre le signal S en entree qui est representatif d'une image 
source IS, et le signal D present a la sortie du systeme, ce signal etant 
representatif d'une image degradee ID. Le calcul du signal erreur est un 
moyen de diagnostic pour revaluation des performances des systemes 
analogiques ou numeriques. Pour les encodeurs et les decodeurs, par 

10 exemple, cette operation souligne Pefficacite de la reduction de debit et met 
en valeur les degradations introduces par cette operation. Elle realise par 
consequent la mesure de la qualite du signal en sortie du systeme. 

Cependant, pour realiser le calcul du signal erreur, il est au 
prealable souhaitable de resynchroniser les deux signaux de maniere a 

15 comparer les valeurs des pixels situes aux memes positions dans les deux 
images. Pour la synchronisation de sequences video, I'article de 
G. BEAKLEY. C. CRESSY et J. Van PELT paru dans le numero de Novembre 
1995 du SMPTE Journal, pages 742 a 750, sous le titre "Video Compression : 
the need for testing", propose une resynchronisation spatiale. Elle est 

20 effectuee par le calcul de la fonction d'intercorrelation entre Pimage degradee 
ID et Timage source IS. La position du maximum de la fonction donne la 
valeur entiere, en pixels, du dephasage spatial de Timage degradee par 
rapport a Pimage de reference la plus proche. 

L'inconvenient majeur de cette methode est de necessiter une 

25 image de reference. Cette contrainte peut se reveler on6reuse et difficilement 
utilisable en pratique, particulierement dans le cas ou les deux versions 
source IS et degradee ID de la sequence video sont physiquement 6loignees. 
De plus, Pimage de reference, non codee, represente une quantite importante 
de donnees a stacker ou a transmettre. Par ailleurs, le temps de calcul 

30 necessaire pour la realisation de ['operation d'intercorrelation est important et 
implique une complexity du dispositif. 

La presente invention a pour objet de realiser de maniere 
automatique la synchronisation spatiale (et eventuellement temporelle) des 
sequences video codees et decodees. Cette operation est exploitable a 

35 chaque fois que reformation de position spatiale et/ou temporeile est 
necessaire. Comme exemple d'application, elle est utilisable pour reussir 
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toute opera«on implant une succession, des P™^^^ 
cas. cette operation evite Introduction de nouveaux defauts dans 

Vld *°' Un autre exemple d'utilisation est une synchronisation 
un autre exe v n e avan , 

5 spatiaie et/ou temporelle pour enecruer un, synchronised 
codage et Hmage decodee. Dans ce second * deux 

permet de mettre ensuite en evidence toutes les deferences entre 

ima9BS - Le precede seton Hrwentton. tien. compte des propriety 

,„ speoinpues des technics mtses en 

structures du contenu des images 6t Luto la 

precede exploUe .'information spafiale de pha (a n^au p, 
taille du bloc), et/ou llnfomtation temporelle de phase 

^see. d e maniere a ^ — - - — ~ ^ 
employee dans le standard MPEG. L invention tir p MPEG, qui 

caractenstiques du traitement de .'image effectue permet 
,aisse oes caractenstiques sur (Image codee. Cette approche , ongma 
20 ainsidese baser exdusivement sur le traitement ^^^es sont 
Les transformees par blocs l.nea.res et ortnogona 
utHisab.es (transforms de Founer, transform^ en 
chacun des blocs d'image f n . m a la pos.t,on n,m, le bloc 
correspondant est obtenu par Toperation : 

ou T(x.y) est la matrice de la transformation egalement 
La transforms en ondelettes de I image esx 9 

disable, en rSrganisant ,es coefficients ^ 
30 des blocs transforms de tai.le souhaitee no J e ^ es 
b,ocs obtenus par les methodes precedentes ^°™* e *" de R de 
discrete DWT). Un mode de reorganisation est ind.que dans 
Queiroz et Collaborators, intitule 'Wavelet and 
Coder" et publie en Avril 1997 dans la revue IEEE Trans, on o 
35 Systems for Video Technology. Vol. 7. No. 2, p. 419-424. 
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En particulier, I'utilisation de la Transformee en Cosinus 
Discrete TCD est tres avantageuse de par ses proprietes et son utilisation 
dans le standard MPEG. 

L'idee de base de I'invention est de mettre a profit le fait qu'a 
5 la position de codage par une grille initiale de codage numerique par blocs, il 
existe un fort taux de compaction des coefficients de la transformee par blocs, 

L'invention concerne ainsi un procede de synchronisation de 
la position spatiale d'une image video pour retrouver la position d'une grille 
initiale de codage numerique, par blocs de codage, de ladite image, 
10 caracterise en ce qu'il met en oeuvre les 6tapes suivantes : 

a) deplacer selon la direction des lignes de I'image et/ou 
selon la direction perpendiculaire aux lignes de I'image, une grille d'analyse 
constitute de dits blocs de codage et correspondant a au moins une partie de 
I'image ; 

15 b) determiner a chaque position de la grille d'analyse, les 

coefficients transformes Fu.v de chaque bloc de la grille d'analyse, par une 
transformee par blocs, et calculer pour chaque position de la grille d'analyse 
un parametre d'activite representatif de I'activite de I'image ; 

c) determiner la position de la fenetre d'analyse pour laquelle 
20 ledit parametre d'activite represente une activite minimale et valider ladite 
position en tant que position de synchronisation. 

Ledit parametre d'activite peut etre la moyenne AM des 
activates asb des blocs de la grille d'analyse, I'activite asb d'un bloc etant 
definie comme etant une combinaison eventuellement ponderee, et par 
25 exemple la somme, des valeurs absolues des coefficients transformes Fu,v, 
dudit bloc par une transformee par blocs, par exemple une transformee en 
cosinus discrete avec (u,v) * (0,0). 

On peut avoir : 

asbrz £ |*(a,v).F(u,v)| p 
30 («.v>(ao) 

k(u,v) est un coefficient de ponderation de la composante 
utilisee. et p une constante. 

Selon une variante preferee, le parametre d'activite est la 
moyenne ES des entropies spectrales esb des blocs de la grille d'analyse 
35 avec : ES = esb, 
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«* — Z/K".v)log s [(p(«.v))l. ou^,v) = fe3 
et 

5 

asb= ^\F(u,v)\ 

|>.>Ho.oi 

F(u,v) designant les coefficients transformers d'un seul bloc, 
par une transformee par blocs, par exemple une transformee en cosinus 
10 discrete. 

La fonction esb qui permet de caracteriser la position de 
synchronisation spatiale peut etre calculee a I'aide de la formule suivante : 

esb = - X A(«,v).p(«,v)log 2 [(p(«»v))] 

(u.v>(0.0) 

aveca?Z> = £ |jfc(u,v).F(n,v)f et p("iVj = ^ 

(u.vH0.0) 

k(u,v) est un coefficient de ponderation de la composante utilisee, et p une 
constante. 

20 II y a plusieurs possibilites pour choisir les constantes k(u,v), 

et le choix de fun ou I'autre se fait en fonction de Implication recherchee. En 
effet, la fonction k(u,v) est choisie suivant la caracteristique a mettre en 
exergue : tenir compte du systeme visuel ou extraire une partie de 
Tinformation pertinente. Les cas suivants sont proposes : 
25 1) le premier procede est a utiliser lorsque Ton privilegie une 

bonne correlation avec la perception humaine. Dans celui-ci, les valeurs des 
constantes k(u,v) sont initialisees en fonction de IMmportance relative des 
coefficients de la transformee pour I'oeil humain, notamment sa sensibilite 
frequentielle, afin de fournir un parametre d'activite representatif de ce qui est 
30 pergu. Par exemple, dans le cas de la TCD, on prend k(u,v)=1/Q(u,v). Les 
Q(u,v) sont les composantes de la matrice de quantification exploitee pour la 
reduction de debit, indiquees dans le document suivant, extrait de la norme 
MPEG-2 : ISO/IEC CD 13818-2 : "Information technology - Generic coding of 
moving pictures and associated audio information - Part 2 : video", 
35 1 Dec 1993, p. 45, § 6.3.7. 



BNyLKJUlU' <!hH 2769432A1J_J- 



2769452 



10 



15 



20 



25 



2) le second precede est utilise lorsque les coefficients TCD 
affectes par la compression sont identifiables. Les constantes k(u.v) sont 
choisies de maniere a eliminer certains coefficients de la transformee utilisee. 
En effet. la ponderation k(u,v) est utilisee pour retenir les coefficients affectes 
ou sensibles a une degradation donnee. II s'agit d'une matrice binaire 
affectant zero aux coefficients a eliminer et un aux coefficients pertinents. La 
selection se base soit sur la position du coefficient dans la matrice TCD (a), 
soit sur son amplitude moyenne (b). 

a) les coefficients correspondant aux hautes frequences 

spatiales sont souvent les plus affectes par la compression. Un exemple de 

matrice de ponderation suivant le rang du coefficient TCD est donne dans le 

tableau ci-apres : u 

v 0000 1 1 
0000 1 1 
0000 1 1 
00 00 1 1 
111111 
111111 
111111 
111111 

b) certains coefficients de faible amplitude sont ramenes a 
zero lors de I'etape de compression. 

Afin de choisir ces coefficients, une moyenne ponderee de 
chacun des coefficients sur la zone d'image analysee (de taille M.N blocs) est 
effectuee : 



'./ v 



moyCoe/(u, v) = T V 



Q{u,v) 



, ou Q(u,v) est defini comme ci- 
dessus, en 1) 



30 



35 



Les coefficients dont les moyennes sont parmi les 48 plus 
faibles valeurs sont retenus. Pour ces demiers, k(u,v)=1 et pour les autres 
k(u,v)=0. 

Dans le cas du parametre "Entropie Spectrale" ES, on fixe 
k(u,v)=1 , et p=l pour la description des exemples. 

II est avantageux de ne valider ladite position lors de I'etape c, 
que si la valeur minimale de I'activite que represente le parametre d'activite 
est superieure a un seuil donne A. qui correspond a une "richesse" minimale 
de I'image qui est requise pour considerer la position de synchronisation 
comme pertinente. 
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Ledit emplacement de la grille d'analyse peut s'effectuer par 
pas egaux a une distance inter-plxels ou a un multiple de 
^placement peut egalemen. s'effectuer par pas inferieurs a la dtstance tnter- 



Selon un mode de realisation prefere. la synchronisation oe .a 
position spatiale met en oeuvre un deca.age dit sub-pixel, c'est-a-d.re un 
dephasage spatial horizontal inferieur a la distance .nter-p.xels. 

Le precede selon invention est dans ce but caractense en ce 
qu'il comporte, avant I'etape a. une etape de conversion analogue 
,0 numerique a I'aide d'un convertisseur presentant une horloge 
SSLo. pour echantil.onner des signaux d'images. et en ce qui 
comporte. ^ ^ ^ ^ ^ ^ ^ , e 

sens des lignes de .'image, en modifiant d'au moins un increment dep la phase 

15 d'echantillonnage des signaux d'image ; nosit ion 
- une etape e de determination, pour au mo.ns une pos.tion 
decalee dX de .a grille d'analyse, definie lors de I'etape d, desdits coefficents 
transforms Fu.v et dudit parametre represented de I'activ.te de I .mag. 

Le precede peut etre alors caractense en ce que, lors de 
20 retape d. on realise une scrutation dite sub-pixel en decant la gn e 
d'analyse selon une p.uralite de dltes positions deca.ees de la gnlle d ^yse 
obtenues en modif.ant par increments dep la phase d'echantllonnage, en ce 
que, lors de I'etape e. on determine, pour chacune des positions decs** 
Lits coefficients transformes Fu.v et .edit parametre represent de 
25 ractivite de .'image, et en ce qu'll comporte une etape f de determ^o d ela 
position dite sub-pixel (d<p 0 . dX o) de la grille d'analyse pour laquel.e led* 
parametre d'activite represente une valeur minimale. 

Le procede peut comporter, apres I'etape e. une etape g de 
determination dudit parametre d'activite selon deux drtes P^"^^ 
dont I'une est une position dite avancee (dX + A) et .'autre est une P os,t.on d,te 



30 

retardee (dX-A). 



35 



Cette etape g peut etre avantageusement su.v.e . dune 
etape h de determination pour chacune des positions, avancee ((dX-A) 
retardee (dX-A), de la moyenne du parametre d'activite sur M images. 

Selon une variante preferee, le procede met en oeuvre une 
contre-reaction sur la phase <p de ladite horloge d'echantillonnage. Ce 
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pilotage peut etre effectue a partir d'un signal d'erreur qui est la difference 
entre ladite moyenne du parametre d'activite pour la position retardee (dX-A) 
et ladite moyenne du parametre d'activite pour la position avancee (dX+A). 

Le parametre d'activite est de preference I'entropie spectrale 
5 ES, et ledit signal d'erreur est de preference normalise par I'entropie spectrale 
moyenne ES d'au moins une zone de I'image. 

Le procede selon 1'invention permet alors d'identifier les 
images du type codees sans prediction (I) en determinant dans une sequence 
d'images synchronises spatialement, les images qui presentent la valeur la 
10 plus faible de I'activite representee par un parametre d'activite, ces images 
etant de ce fait identifies comme etant de type code sans prediction, c'est-a- 
dire du type I. 

Le procede peut egalement permettre d'identifier les images 
du type codees avec prediction (P) en determinant dans une sequence 
15 d'images, les images presentant la valeur la plus elevee de I'activite 
representee par un parametre d'activite, lequel est de preference I'activite 
moyenne AM d'au moins une zone des images de ladite sequence. 

Ce parametre d'activite peut etre determine sur la totality de 
rimage ou sur une zone d'interet de celle-ci. 
20 Avantageusement, une dite determination s'effectue apres 

filtrage passe-haut du signal representatif du parametre d'activite des images 
de ladite sequence d'image, de maniere a eliminer au moins partiellement 
('evolution du contenu des images a Tinterieur de la sequence. 

Ledit filtrage passe-haut consiste avantageusement a calculer 
25 chaque point du signal filtre par calcul du plus petit 6cart positif entre un point 
correspondant a I'image courante du signal non filtre et les points voisins 
correspondant a I'image precedente et a I'image suivante. 

D'autres caracteristiques et avantages de ('invention 
apparaitront mieux a la lecture de la description qui va suivre, en liaison avec 
30 les dessins ci-annexes, dans lesquels : 

- la figure 1 illustre le procede mis en oeuvre selon la 
presente invention ; 

- la figure 2 represente un exemple de structure de groupe 

d'images GOP ; 
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- la figure 3 est un exemple illustrant la variation du parametre 
d'entropie spectra.e ES en fonction du dephasage spatial de la grille d'analyse 
GA. pour une image I d'une sequence codee a 4Mbits/seconde ; 

- la figure 4 illustre un exemple de variation temporelle du 
parametre d'entropie spectra.e ES sur une sequence GOP pour una 
scrutation selon la direction horizontal X en supposant connue la 

synchronisation verticale Y ; 

- la figure 5 est un exemple de mise en oeuvre de 1'mvent.on 

appliquee a un signal analogique ; , . . 

) - la figure 6 illustre differentes possibilites de numensat.cn 

d'une portion de ligne d'un signal analogique selon deux instants 
d'echantillonage^et^ decates en phase ded<p; 

- la figure 7 illustre une recherche de la posifion 
correspondent au minimum du parametre ES ; 

5 - les figures 8a et 8b illustrent I'obtention d'un s.gnal d erreur 

de phase ; ^ ^ ^ ^ ^ ^ ^ respectjvement r6volution 

de ES sur 250 images d'une sequence cochee a 4Mbits/seconde apres 
synchronisation spatia.e (9a), ^extraction des minima locaux de ES apres 
10 filtrage passe-haut (9b), et enfin le resultat de .a detection des .mages 1 (9c) 

- et les figures 10a a 10c illustrent respecfivement le s.gnal 
AM d'extraction des pics du parametre d'activite AM sur 12 images d'une 
sequence GOP codee a 4Mbits/seconde (10a), le signal AM filtre par filtrage 
passe-haut (10b). et le resultat de la detection des images P (10c). 
, 5 L'invention telle que decrite ci-apres met en oeuvre la 

connaissance du procede de codage de sequences d'images par une norme 
par exemple MPEG2. En effet, les particularity de cette technique offrent des 
possibilites avantageuses pour le traitement du signal video code. Une 
description succincte des elements algorithmiques implantes dans MPEG est 
30 utile a la comprehension du principe de l'invention. mais on remarquera que 
('invention s'applique egalement aux autres codages numenques 

Pour effectuer la reduction de la quantite d'.nformat.on 
contenue dans des images IM. le codage par exemple MPEG1, MPEG2, ou 
ISO H261 ou bien JPEG (pour la synchronisation spatiale) repose sur 
35 certains outils algorithmiques. Pour le codage des valeurs des po.nts .mage 
ou pixels, de I'image, les algorithmes precites tirent parti de la ressemblance 
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entre des pixels voisins sur une meme image (redondance spatiale) et entre 
des images voisines (redondance temporelle). La transformee en cosinus 
discrete (TCD), par blocs de 8x8 pixels, est appliquee pour reduire la 
redondance spatiale. L'image est done, au prealable, decoupee en blocs. La 
5 reduction d'information est faite en arrondissant les valeurs des coefficients 
TCD obtenus (quantification scalaire). La transformee en cosinus par blocs de 
NxN pixels (par exemple N=8) change la base de representation de l'image. 
Cette transformation est effectuee a partir d'une grille initiale Gl presentant 
des blocs de NxN pixels et dont les bords sont les bords de l'image initiale 

10 codee IM (voir figure 1). Pour reduire la redondance temporelle, un codage 
predictif est utilise. II opere une estimation des echantillons a coder par une 
prediction obtenue en fonction des valeurs precedentes du signal. L'erreur de 
prediction est codee, et elle offre une reduction forte de I'information a 
representee La prediction est realisee sur les images antecedentes dans I'axe 

15 des temps. L'image "erreur" obtenue est par la suite codee par la transformee 
TCD. Au decodage, les images sont reconstitutes a partir des images de 
prediction et des donnees codees. 

La regulation qui permet d'obtenir un debit constant en sortie 
de I'encodeur impose ('utilisation d'une regularity dans I'application des 

20 differents algorithmes temporels. En effet, la norme MPEG2 specifie une 
syntaxe de codage predictif appliquee aux sequences d'images. Chaque 
image est codee suivant un type particulier de prediction : I, P et B. 

- les images I (intra) sont codees par TCD sans prediction et 
done sans tenir compte de leur passe. Elles sont considerees comme des 

25 images fixes et isolees. 

- les images P sont obtenues par codage predictif a partir de 
l'image I ou P qui la precede. 

- les images B (bi-directionnelles) specifiques a MPEG-2 sont 
obtenues a partir des deux images I ou P les plus proches, par interpolation. 

30 Un groupe d'images ou GOP est une structure qui se repete 

dans le temps et represente la sequence video. II est compose d'un nombre 
d'images n egal a la distance entre deux images "I" et dans lequel les images 
"P" ont une periodicite m. Ces parametres caracterisent entierement la 
structure du GOP (voir figure 2). Dans I'exemple represente, n=12 et m=3. 

35 La TCD est largement utilisee pour le codage d'images. Le 

precede decrit ci-apres se propose a titre d'exemple de i'appliquer pour 
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analyser des sequences codees et decodes en vue de 

operations de synchronisaUon. Cette approone avanageuse demontre une 

arande efficacitt de robustesse. -_.ti.io 
9 un oremier obiet de Invention est la synchron.sation spattale 

5 de rimage sur .a postton de ,a grfle de codage Male G, . En effet dee 
besoins de re-cadrage. une operation d'idem,f,cm«,n de 
realisee. Pour oeci. des indicateurs obtenus a partir de .a transformee 

cosinus sont utilises. ^.„,i„„ Claire des 

Lors du codage. les tables de quantification scalaire aes 

0 coefficients TCD amenen, a concent I'energie du bloc 

nombre limite de coefncients represents. Les autres son. anond* noe 
valeur nu«e. Cette operation restele noyau meme de la reduction de debt 

Sur une image numerique codee et decodee. 
r este valable. En effe, on constate que. si une section au niveau des^ Woes 
,5 est effective, la position oorrespondant a la gnlle mttiale de 

pi^te une con P oentra«ion Margie particuliere. Par co = L*m 
propose constltue ridee de base qui est mise en oeuvre pour .denser a 
poLn de la grille initiale de codage. Parmi les 

Lsformee TCD as, avantageuse car elle es. utt see , dan le standard 
20 MPEG D'autres transform** par blocs sont utilisables (par exempte 
^ de Fourier, transfonoee en ondelettes DWT, ; et I nes p 
necessaire que la transformee utilisee soi. la meme que celle selon laquelle 

rimage initiale a 6t4 codee. „„„„^hroniser 
La propriete de base utilisee pour se resynchroniser 

,5 spatiaiement est la concenttation de renergie des coefncients par exemple 
TCD autour de la composante continue de cheque bloc d '' ma 9 e . 

Afin de rSaliser cette fonction de synchronisation, un 

indicateur spatial a ete teste avantageusement. - 

La propriete consideree est plus selective pour les images 
30 que pour les autres types d'images. L'activite d'un bloc est d*fin,e par 
exemple par I'equation suivante : 

35 F(u.v) designant les coefficients transformes du bloc auquel 

est appliquee la transformee en cosinus discrete TCD. 
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L'equation suivante definit I'activite moyenne de I'image ou 
d'une zone d'interet Zl de celle-ci, par la moyenne des activites blocs 
AM = asb 

Une des proprietes des transformees par blocs, et en 
5 particulier de la TCD est leur capacite a compacter I'information de I'image 
dans un petit nombre de coefficients. Le parametre AM\indique la quantite 
moyenne d'information dans le domaine TCD qui est contenu dans les blocs 
analyses. Ce parametre est calcule pour une position donnee de la grille GA 
des blocs qui peut recouvrir la totalite de I'image. ou bien seulement la zone 
10 d'interet Zl. 

Bien qu'efficace, le parametre asb ne donne aucune 
information sur la repartition de I'energie dans les coefficients de TCD, et en 
outre, asb est sensible a I'amplitude des coefficients TCD. 

On utilisera done de preference I'entropie spectrale esb d'un 
15 bloc definie par exemple de la maniere suivante : 

Z/*«.v)tog 2 [(rtu.v))] t ou/<«,v) = E^ 

L'entropie spectrale ES de I'image (ou d'une fenetre d'analyse 
20 Zl), est donnee par la moyenne des entropies spectrales esb des blocs de la 
grille d'analyse GA dans la fenetre d'analyse Zl ou pour ia totalite de I'image. 
ES = esb. 

A la position initiate de la grille Gl des blocs, e'est-a-dire a la 
position de leur codage, une certaine quantite d'information a ete negligee et 
25 ecartee par le codeur. Cette action lui permet de reduire I'information 
pertinente a coder. Par ailleurs, le codage des differents blocs est effectue 
independamment de leurs voisins sur la meme image. 

Selon I'invention, on met en oeuvre une grille d'analyse GA : 
presentant des blocs de NxN pixels et que Ton deplace pour realiser une ; 
30 scrutation horizontale et/ou verticale de la totalite de I'image ou de la fenetre 
d'analyse ou zone d'interet Zl. 

Lorsque la grille d'analyse GA est disposee a une position ■ 
correspondant au codage initial, les parametres AM et surtout le parametre 
ES presentent un fort taux de compaction pour les coefficients TCD. 
35 Par contre, lorsque I'activite moyenne AM ou l'entropie 

spectrale ES est calculee pour une grille d'analyse GA prise a une position 
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differente de celle de la grille initiale Gl (voir figure 1). elle presente une 
information supplemental. Cette information tient compte de toutes les 
discontinues et des differences de contenu entre les blocs adjacents, c'est-a- 
dire de i'effet de bloc qui est du au codage independant des d iff e rents blocs 

5 d'une meme image. 

En tout cas, elle ne devrait aucunement presenter une 
quelconque concentration d'energie telle qu'il est constate dans le cas ou la 
position de la grille d'analyse GA est coherente avec le codage initial. 

La position coherente 6u initiale des blocs de codage n'est 

10 pas connue a priori. La scrutation de toutes les positions avec des decalages 
horizontaux et/ou verticaux de (dX, dY) pixels est realisee a I'aide d'une grille 
d'analyse GA. Elle amene a considerer qu'il existe une valeur minimale du 
parametre AM ou ES a la position recherchee (coherente). Un exemple d'une 
telle scrutation est represents a la figure 3. 

15 Le point C correspond au minimum de ES parmi toutes les 

positions de scrutation de la grille GA pour une meme image. 

La valeur minimale de ES (point C) a la position de codage, 
est ici representee par un decalage nul (dX,dY) = (0,0). 

Le parametre AM ou ES calcule est done un indicateur de la 

20 dispersion moyenne des coefficients F de la transformee TCD des blocs. A la 
position de codage des blocs (point C de la figure 3), une valeur de dispersion 
presentant un minimum relatif par rapport aux autres positions de scrutation 
est obtenue. 

Un minimum peut etre obtenu par scrutation en deplagant la 
25 grille d'analyse GA uniquement dans la direction horizontale, pour obtenir une 
synchronisation horizontale ou par scrutation en depla<?ant la grille d'analyse 
GA uniquement dans la direction verticale pour obtenir une synchronisation 
verticale, mais on realise de preference une scrutation selon les deux 
directions, horizontale X et verticale Y, la valeur minimale de AM ou ES 
30 donnant la position de synchronisation correspondant a la position de la grille 
initiale. 

La grille d'analyse GA peut recouyrir la totalite de I'image, 
mais elle peut se limiter a une region seulement de I'image constituant une 
zone d'interet Zl comme represents a la figure 2. 
35 Dans le cas ou la grille d'analyse GA interesse la totalite de 

I'image, sa dimension reste toutefois legerement inferieure a celle de I'image 
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a analyser de maniere a ce que la grille cTanalyse GA ne deborde pas de 
I'image lors de la scnjtation. On utlise par exemple une grille d'analyse GA 
dont la dimension est inferieure de N pixels a celle de I'image, a la fois dans le 
sens horizontal et/ou dans le sens vertical, selon que la scrutation doit etre 
5 operee selon une direction ou selon ces deux directions. 

Ce critere est utilise selon 1'invention pour la synchronisation 
spatiale. Toutefois, il est important de remarquer que I'utilisation de cette 
approche n'est possible que si Pirnage a un contenu suffisamment riche. Une 
condition prealable est definie a partir de Tindicateur de la richesse ou activite 

10 moyenne AM du contenu d'une image. En effet, une valeur minimale est 
requise a la position de synchronisation spatiale, a savoir AM > AM Q . Le seuil 
AM 0 est determine de maniere a eliminer les images de faible activite sur 
toute leur surface ou dans la zone Z\. 

Pour les images "I" cod6es sans reference temporelle, le 

15 param&re AM ou ES presente une valeur minimale lorsqu'il est calcule a la 
position de codage des blocs. Sur les images n P w ou "B n , la meme propriete 
est verifiee meme si la reponse obtenue est toutefois moins nette. 

Cette propriete est mise en evidence sur I'exemple represents 
a^ la figure 4, obtenu a partir d'une sequence de 12 images codee a 

20 SMbits/seconde. Pour les besoins de la representation, la synchronisation 
verticale est supposee etre connue et seule la synchronisation horizontal est 
supposee inconnue. Les courbes du haut I a VII represented les resultats 
obtenus pour les sept positions de scrutation horizontale qui ne 
correspondent pas a la position initiale. La courbe VIII correspond a la 

25 position de synchronisation sur la grille d'analyse GA, c'est-a-dire sur la 
position de codage initial. Ces courbes montrent que, sur une image donnee, 
le parametre ES a toujours une valeur inferieure lorsqu'il est calcule a la 
position de codage initial. On reconnaTt sur la courbe VIII les images T, pour 
lesquelles Tecart entre la position coherente et une autre position est 

30 relativement plus important que pour les autres images. Dans ce cas, on peut 
egalement voir que le groupe damages GOP est compose de n=12 images, 
puisque c'est le nombre damages qui separe deux images de type I. On 
reconnait egalement les images de type P, qui presentent des maxima du 
parametre ES. Les autres images sont de type B. 

35 La recherche de la phase spatiale d*une image de la 

sequence video, consiste done a calculer le parametre AM ou de preference 
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ES. Ce calcul est effectue a chacune des NxN, soit 8x8 positions possibles de 
la grille de codage (voir encadre de la figure 1). Le decalage spatial des blocs 
de codage par rapport a une grille d'origine dont les bords correspondent a 
ceux de I'image d'origine est donne par la position de la valeur minimale du 
parametre AM ou ES. Ce calcul peut etre invalide si la valeur de AM a la 
position de codage trouvee est inferieure a un seuil AM 01 ce qui 
correspondant a un contenu trop pauvre pour pouvoir faire toute analyse 
fiable. 

Cette limite du procede h'est pas fondamentalement gSnante. 
Prenons Pexemple de I'application a une cascade de codages-decodages. En 
effet, pour des images pauvres en termes de contenu, meme si elles ne sont 
pas synchronises spatialement, I'encodeur n'aura pas de difficultes a les 
coder. Par consequent, la mise en cascade de codeurs-decodeurs n'altere 
que les images riches en contenu. Pour ces dernieres, la synchronisation 
15 s'impose et la methode proposee est efflcace et robuste. 

La procedure de synchronisation spatiale sur une image peut 
etre effectuee de la maniere suivante : 

a) acquerir I'image, 

b) determiner les valeurs de ES a toutes les positions 
20 possibles de la grille d'analyse GA, 

c) determiner le dephasage spatial qui est donne par la 
position de la valeur minimale de ES, 

d) tester ia validite de la mesure pour verifier si le contenu de 
I'image est suffisamment riche : 

25 . si AM > AM 0 , alors la synchronisation est realisee, 

. sinon retour a a). 

Le procede decrit au paragraphe precedent correspond au 
cas d'images numeriques. Cependant, I'utilisation de signaux analogiques est 
encore frequente en pratique. Le procede peut etre adapte au cas des 
30 images analogiques ayant precedemment ete soumises a un codage 
numerique. 

Dans le cas ou les images pour lesquelles une 
synchronisation spatiale est recherchee sont sous la forme d'un signal 
analogique, le decalage spatial peut en effet avoir une valeur qui n'est pas 
35 egale a un nombre entier d'intervalles inter-pixel (ou pas des pixels) dans la 
direction horizontale. Ce decalage peut eventuellement avoir ete introduit au 
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niveau du Convertisseur Analogique-Numerique. Le procede expose plus 
haut permet bien de detecter le dephasage horizontal, mais il effectue un 
arrondi a un nombre entier de pixels en raison de la discretisation de I'image. 

II est dans ce cas possible, selon I'invention, de corriger la 
partie fractionnaire (ou sub-pixel) de la valeurdu dephasage spatial horizontal 
(c'est-a-dire dans le sens des lignes de I'image). Le procede permet alors de 
realiser une synchronisation spatiale a une fraction de pixel pres. Cette etape 
est en general posterieure a une synchronisation spatiale effectuee au pixel 
pres par le procede expose plus haut, mais il est egalement possible d'obtenir 
une synchronisation horizontal sub-pixel uniquement a I'aide du procede 
decrit ci-apres, illustre par la figure 5. 

Dans celle-ci, la phase de I'horloge H de numerisation du 
Convertisseur Analogique-Numerique CAN charge d'acquerir le signal video 
analogique d'entree VA, est pilotee par le signal CP genere par I'equipement 
numerique de synchronisation EQ. Cet asservissement exploite I'indicateur 
ES d' Entropie Spectrale. 

L'equipement EQ recoit a son entree le signal video 
numerique VN numerise par le convertisseur CAN, et il produit en sortie, un 
signal DS de dephasage spatial (X.Y), un signal CG de composition de 
groupe d'images GOP et un signal logique SL de presence ou d'absence 
d'une image I, fournis a un codeurCOD. 

Un processeur PAS de calcul du parametre d'activite est mis 
en oeuvre pour calculer le parametre AM ou ES en fonction de VN et 
eventuellement de signaux decales VN(-a) et VN(+A) ainsi qu'il sera explicite 
plus loin. Le processeur PCD de commande et de decision analyse les 
resultats produits par le processeur PAS et effectue la recherche de la valeur 
DS de synchronisation spatiale, la commande CP de la phase 
d'asservissement du convertisseur CAN et I'analyse syntaxique MPEG-2 de la 
sequence et la detection des images "I". 

Ladite operation de calage de phase peut etre faite 
ponctuellement, par exemple une seule fois a ('initialisation de l'equipement. 
Elle peut egalement faire partie d'une procedure d'adaptation a la chaTne 
analogique a chaque fois qu'il est necessaire de reajuster le systeme a de 
nouvelles conditions. Elle peut egalement etre menee sur une sequence 
video continue. 
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Le principe de ce precede est une extension du precedent au 
domaine continu (ou analogique), par opposition au domaine discretise. 
Reprenons-le dans le cas d'une image numerique : la scrutation de toutes les 
positions possibles de la grille d'anaSyse GA des blocs ne peut se faire que 
5 sur des valeurs entieres de pixels en raison de la discretisation de I'image. La 
scrutation des positions sub-pixel est done realisee ici par une petite 
modification dp de la phase de I'echantillonnage et en particulier de la phase 
de I'horloge d'echantillonnage du convertisseur analogique-numerique CAN. 
Cette modification dq> introduit un". decalage inferieur a la periode 
10 d'echantillonnage Te qui correspond a un decalage de 1 pixel. La figure 6 
illustre le cas de deux echantillonnages ECH^) et ECH(t 2 ) realises a des 
instants t, et t 2 decales de maniere a correspondre a un dephasage d<p. La 
commande de phase se realise par exemple en commandant en phase 
I'oscillateur a commande numerique (O.C.N.) qui genere I'horloge H 
15 d'echantillonnage. Par la suite. I'acquisition d'une nouvelle image numerique 
est effectuee pour chaque nouvelle position de scrutation. 

La phase de numerisation optimale est donnee comme 
precedemment par le critere du minimum de AM ou de ES sur une plage de 
scrutation donnee en commandant le deplacement de la grille d'analyse GA 
20 par variation de la phase dep. Le graphique de la figure 7 montre failure de la 
fonction continue ES(DX) et les valeurs qui sont accessibles avec le precede 
de synchronisation spatiale par un nombre entier de pixels. On voit d'une part 
que ('introduction d'un dephasage de numerisation permet de choisir de 
nouvelles positions pour calculer des valeurs de ES. Une variation tres fine de 
25 d(p sur un intervalle de temps Te correspondant a un decalage d'un pixel offre 
la possibility de couvrir de maniere precise la fonction ES(dX) (voir figure 7). 

Le precede de correction de decalage sub-pixel comporte de 
preference deux etapes. La premiere etape consiste a rechercher pacvaleurs 
entieres la position la plus proche du minimum de AM ou de ES. La seconde 
30 etape est iterative et consiste a acquerir des images legerement dephasees 
d<p, variant sur une plage de ± Te (soit ± 1 pixel) et a calculer le parametre AM 
ou ES a la position trouvee a la premiere etape, mais qui se trouve decalee 
de dq> 

dep = 1/N.Te 

35 N definit la finesse de la scrutation et la precision avec laquelle sera obtenue 
la position optimale. Pour chaque increment de la phase, AM ou ES est 
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calcule. Le dephasage dcp optimal de I'horloge de numerisation, c'est-a-dire 
celui qui est a maintenir correspond au minimum de la fonction AM ou ES. 

Cependant, il existe en toute rigueur une condition de 
realisation pour la synchronisation spatiale. En effet, a chaque valeur de la 
5 phase, une acquisition est effectuee. II serait done preferable d'utiliser un 
signal video representant une image fixe a la sortie du convertisseur 
analogique numerique, par exemple une image memorisee. De cette maniere, 
la meme acquisition est faite, et par la suite les traitements sont realises sur 
une meme image. 

10 Le procede peut etre mis en oeuvre avec des images 

variables, comme illustre aux figures 8a et 8b. 

En effet, a partir de la position courante du decalage de 
phase dcp, correspondant a un ecart de dX inten/alles inter-pixels et ayant une 
valeur d'entropie ES(dX), deux mesures d'entropies sur des positions 
15 volontairement decalees sont effectuees, Tune dite position avance, soit : 

ES a (dX) = ES(dX+A) 
I'autre dite position retard, soit : 
ES r (dX) = ES(dX-A) 
ces mesures etant des moyennes de la valeur du parametre ES sur plusieurs 
20 images, et A etant inferieur au pas des points images ou pixels dans la 
direction des lignes de Timage. 

Le calcul d'une fonction erreur est effectue a partir de ces 

mesures : 

ES^dX) = ES r (dX) - ES a (dX). 

25 Cette erreur pilote une contre-reaction sur la phase de 

I'horloge d'echantillonnage. Elle est representee sur les figures. 

Le cas echeant, cette erreur est normalisee pour chaque 
image, par exemple par I'entropie spectrale moyenne ES de I'image ou de la 
zone Zl pour la rendre plus independante du contenu de Hmage. 

30 Plusieurs mesures successives sont effectuees a la meme 

position du decalage de phase dcp, et sont ensuite filtrees passe-bas avant de 
fournir la commande d'asservissement de roscillateur a commande 
numerique OCN generant Thorloge d'^chantillonnage. Cette commande est 
bien sur appliquee en synchronisme avec I'acquisition des images. 
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En ce qui concerne la mise en oeuvre pratique de cette 
variante, les mesures des pararnetres spectraux avance et retard peuvent 
etre realisees : 

- soit en parallele, ce qui necessite trois chaines d'acquisition 
5 (une pour la voie dite synchrone qui alimente le codeur video, deux pour les 

mesures avance et retard de AM ou ES), 

- soit sequentiellement, ce qui reduit le besoin a deux chaines 
d'acquisition. Ce besoin est limite a une seule chalne si une initialisation est 
permise (convergence de I'asservtssement). Dans le cas sequentiel, 

10 I'alternance des mesures avance et retard sur des images successives doit 

etre synchrone du rythme d'acquisition des images. 

De plus, le pas du decalage A est adaptable au besoin : 

A = 1 pixel : ES r (dX) et ES a (dX) sont directement disponibles 

lors de I'etape de calcul realisant la synchronisation au pixel pres. 
15 A < e ; si z est choisi suffisamment faible pour ne pas 

perturber le codeur video, ce codeur peut etre alimente par une voie 

d'acquisition unique alternativement decalee en avance ou en retard de 

phase pour realiser les mesures des pararnetres d'activite spectrale ou 

d'entropie spectrale ES r (dX) et ES a (dX). 
20 ^invention offre ainsi un moyen de resynchronisation spatiale 

fine a (1/N pixel) pres correspondant a la resolution en phase de I'oscillateur a 

commande numerique OCN generant I'horloge d'echantillonnage. 

Cette operation est realisee par asservissement de la phase 

de Thorioge de numerisation du convertisseur analogique-numerique & partir 
25 du calcul par exemple d'entropies spectrales de Timage en sortie du systeme 

video, par exemple selon la procedure sequentielle suivante : 

a) numeriser une image, 

b) rechercher le dephasage horizontal arrondi a un noxnbre de 
pixels entiers (procedure de synchronisation spatiale), 

30 c) introduire alternativement, avec un rythme correspondant a 

un nombre entier damages, un dephasage horizontal de ±A sur le 
convertisseur analogique numerique CAN et realiser en synchronisms les 
mesures Es r (dX) et ES a (dX) apres numerisation des images correspondantes, 
d) calculer la fonction erreur et la filtrer par filtrage passe-bas 

35 avec les mesures precedentes, 
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e) appliquer la contre-reaction sur I'horloge du convertisseur 
analogique-numerique CAN. Itererla procedure sure). 

Dans le cas de mise en cascade de deux codeurs, nous 
avons souligne rimportance d'une synchronisation spatiale des pixels a coder. 
5 En effet, cette operation s'impose afin de tirer parti d'une maniere optimale 
des techniques de compression en tenant compte de la qualite finale des 
images. D'autre part, nous avons decrit la syntaxe recommandee par la 
famille des codages MPEG pour le codage des sequences d'images 
(I, P et B). En tenant compte de cette syntaxe, on peut egalement optimiser 
10 I'utilisation des methodes de compression. En effet, puisque cette syntaxe 
agit sur le nombre de bits alloues par image ainsi que sur sa qualite, son 
respect est avantageux, voire essentiel pour une mise en cascade. 

Selon invention, il est possible de realiser une identification 
de la syntaxe temporelle du codage initial. Ceci passe par la reconnaissance 
15 des images, I, P et B. La synchronisation temporelle, presentee ici, a pour 
objet de reperer quelles sont les images I, P et B. Cette operation n'est 
effectuee qu'apres avoir realise la synchronisation spatiale. Le precede global 
peut done se resumer par : 

a) acquisition d'une image, 
20 b) recherche de la position de codage spatial, 

c) recherche si cette image est de type T, 

d) si cette image est de type T, 

alors analyser le contenu du groupe damages GOP precedent 
et identifier les images "P" et "B". 
- 5 Les images de type T donnent un minimum local net dans le 

temps sur un parametre tel que AM ou ES (voir figure NT 4). En raison du 
mode de codage sans prediction des images "I", ces demieres sont en effet 
temporellement marquees par rapport aux autres images. C'est le cas pour 
des sequences a faible activity temporelle ou qui pr6sentent des 
30 changements restreints de contenu. Un exemple representatif est le debut de 
la sequence de la figure 9a, images [0,150]. 

Toutefois, les valeurs du parametre AM ou ES sont liees au 
mode de codage de I'image (l,P,B) mais aussi au contenu de I'image, etant 
donne sa definition (voir ci-dessus). Ainsi, un important mouvement est 
35 present dans la seconde partie de la sequence de la figure 9a, vers Tintervalle 
d'images [170,220]. Cela se traduit visuellement par une image moins 
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detaillee. Les coefficients de la transformee TCD representant des frequences 
spatiales elevees sont moins presents : I'energie de I'image est done en 
moyenne plus compactee vers les basses frequences, d'ou une baisse des 
valeurs de ES(t) dans I'intervalle des images concemees. Par consequent, 
dans cette sequence, une baisse globale des valeurs de ES(t) est constatee 
pour les images "I". La presence des minimas locaux temporels discriminants 
pour les images "I" est conserves [.'identification correcte des images passe 
de preference par un traitement sur AM(t) ou ES(t) pour extraire ces minimas 
locaux. 

Afin de separer au mieux I'influence du contenu de la 
sequence et ('information recherchee, un filtrage passe-haut peut etre alors 
effectue (figure 9b). En effet, les minimas locaux sur ES(t) durent le temps 
d'une image, e'est-a-dire un point sur I'axe des temps, alors que revolution du 
contenu a I'interieur d'une sequence est plus lente. 

Pour I'operation de filtrage passe-haut, chaque point ES filtr6 (t) 
est obtenu par calcul du plus petit ecart positif entre ES(t) pour une image 
donnee et ses deux voisines (pour I'image precedente et pour I'image 
suivante) J 

ESfaUt) = max [min(0,ES(t) - ES(t-1 )). min(0,ES(t) - ES(t+1 ))] 

A ce point du traitement, toutes les variations de courte duree 
sur les valeurs de ES(t) sont extraites (figure 9b). II est cependant possible 
qu'il n'y ait pas de pics marques de cette fonction. Cela correspond au cas ou 
les groupes d'images ne sont composes que d'images "I" : les minimas locaux 
de ES(t) ne sont plus discemables, ce qui donne une reponse quasi 
constante pour ES(t) filtr6 . Cette hypothese est examinee avant d'engager 
d'autres traitements par le test : 

EcartType k (ES(t) filtr6 ) < SeuilESi 

On considere ainsi que les fluctuations de ES^t) sont 
negligeables lorsque I'ecart-type de ES fflw (t) sur les K dernieres images est 
infeneur a un seuil donne. Une conclusion possible est que tous les groupes 
de la sequence des K images, sont composes uniquement d'images de type 
"I". La valeur de K peut etre fixee a une valeur donnee, par exemple la 
longueur maximale du groupe d'images GOP fixee a partir de 
recommandations MPEG2 par exemple. 

Dans le cas ou la condition precedente n'est pas remplie on 
considere qu'il existe des maximas locaux pour ES filtr6 (t). Par consequent, ce 
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constat implique que le groupe damages est compose d'images T et d'autres 
types d'images. 

Afin d'isoler tes images de type "I", un seuillage adaptatif est 
effectue sur ES^tt). En effet, comme la valeur de ES(t) depend du contenu 
5 de I'image, celle de ES fittr6 (t) en depend egalement. Pour tenir compte de 
cette realite, un seuil arbitrairement fixe ne petit assurer la discrimination 
attendue pour la detection des maximas locaux de ES filtr6 (t). La valeur de ce 
seuil est adaptative, en fonction de la valeur du parametre ES filtr6 (t) a I'image 
T precedente, par exemple : ' 

10 SeuilES 2 (^) = [EWti pr **d e nte)] / 2 

Pour la detection de la premiere image de type T, la valeur 
de seuil choisie est egale au maximum de ES filtr6 (t) trouvee sur quelques 
images (par exemple K=16 ici). La valeur de K doit etre choisie de telle sorte 
qu'il y ait au moins une image "I" dans cette duree. 
15 Seui 'ES 2 (t premi e reimagei ) = max k (Es filtr6 (t) / 2 

Les valeurs de ES filtr6 inferieures au seuil SeuilES 2 (t,) sont 
forcees a zero, et les autres sont maintenues. Les pics correspondant aux 
images de type "I" apparaissant nettement par comptage des valeurs nulles, 
on trouve la taille du groupe damages GOP. Dans Texemple de la figure 9c, le 
20 nombre n damages dans les groupes d'images GOP est egal a 12. 

La detection des images de type T peut etre effectuee de la 
maniere suivante : 

a) acquisition de I'image a Tinstant L 

b) synchronisation spatiale, 
25 c) calcul de ES(t), 

d) filtrage passe-haut de I'historique de ES(t) sur K images a 
partir de la premiere image de type T\ 

e) si ecartType^ES^^e) < SeuilES 1f toutes les images sont 
de type "I" (il n f y a pas d'image predite temporellement "P et B") f 

30 sinon : 

f) modification du seuil adaptatif : 
SeuilES 2 (t l )=[ES filtr6 (t lpr , C e de nt e )]/2 

g) si ES fi{tr Q est superieur au seuil SeuilES 2 (t,), cette image est 

une image T, 

35 h ) la taille du groupe d'images est donnee par la distance 

entre les deux images de type T successives. 
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^.eCerlesimageT;^' 60 "' 0 " ' ma9eS * ^ "'" ' " p ° SSibte da 

invent . ™!l d . e j r !! 0nnai,re ' eS ««- <""-»«. - P-ente 

i n m „™ V " prem,er temps identifier la reference du 

gmupe d, mages GOP. En effef. les images de type T peuvent etre 

aZ2l eS H C ° mme ,e " eS ' PUiSqU ' e " eS Se diStin 9 Uent das «~ P- >es 
algonthmes de compression qui leur sont appliques. Une fois cette operation 

reaHsee, ,1 est possible de detecter les autres categories d'images. 

dW™ ™o r°" r d6tSCter ' eS ima9eS de * pe " r signages dans le groupe 

tZST, mi ™ ma * ^ ampHtUde de ES «» ° m *« "<*«*■ Pour 

'denttfier les images T", une propria avantageuse est mise a profit En effef 

m a S „il a9eS . P ? dUiSent dSS maXima ' 0CaUX SUr 16 P aramalre ES. mais ces 
™™ S ° n ' P ' US marc l u _ es avac *> P^metre traduisant I'activite spatiale AM 
des,magesavecAM = asb. par rapport aux images "B" 

oairui* m , fT 3 Premier ' ieU ' rindicateur s P a «=l **> images AM(t) est 
ca cuie pour toufe ,a sequence video. Sacham que la position des images de 

%LL 7 T C ° nnUe ' UnS ana ' yse du 9rou P e °' lma 9 aa P^ des 

vZr, 1™ 8,re e,feC,U * e - Ced 56 * radui « P ar '* -piacemen, des 
valours AM(t) comaspondan, a des images de type T par la valeur 

s^VfeestTm"; ■ Ce '! e 06 '' ima9e ' a P ^ de (fl9Ure 10a >' La ma '"°de 
suivie est similaire a la precedente. 

AfcWt) = min[max(0.AM(t) - AM(t-1 )), max(0.AM(t) - AM(t+1 ))] 

10b AP ^ S fi ' tra9e Passe " haut ,e s, '9 nal est represente a la figure 

, 08 m ® me qUe P ° Ur 16 re P era 9 e des images de type "I", un 
eu .age adaptatif donne ,a position des images de type «P". dans L cas ou i. 
existe des images de type "B". 

L'hypothese de ('absence d'images "B" est testee par ■ 
ecartType (AM flltrt ) < SeuilA, 

oermet Hp » rn ^ '* |,a PP |icatio " de Iteration de seuillage 

dZce en ^ P ° Siti ° n *" im89eS de tyPe " P " et par consequent , a 
aistance entre deux images de ce type : 

SeUllA 2(t premiere Image p) = Hiax(AM filtr6 (t))/2 

k 

SeuilA 2 (t P ) =IAM filw (tp prtc6dente)] /2 
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Le resultat de la detection des images n P n est illustre a la 

figure 10c, 

La detection des images de type "P" peut etre effectuee de la 
maniere suivante : 

5 a) acquisition de I'image a I'instant t, 

b) synchronisation spatiale, 

c) calcul de AM(t), 

d) filtrage passe-haut de i'historique de AM(t) depuis la 
derniere image de type "I", 

10 e) si ecartType(AM filtr e) < SeuilA,, toutes les images sont de 

type "P" (il n'y a pas d'image bidirectionnelle predite "B"), 
sinon : 

f) rafraichir le seuil adaptatif : 

SeuilA 2 (tp) = [AM fllw (tp pr^ente)]^ 

15 9) si AMf,,^ est superieur au seuil SeuilA 2 (tp) f les images 

correspondantes sont des images de type w P n . 

On notera qu'il est egalement possible de retrouver les 
images de type "P" a partir des maxima de la fonction ES (voir par exemple la 
courbe de la figure 4), mais on notera que cette fonction ES est moins 
20 discriminante que la fonction AM. 

La presente invention propose egalement un procede de 
reconnaissance de la structure des groupes damages telle qu'elle a ete 
definie par les recommandations MPEG2. ! 

Cette identification de la syntaxe des groupes d'images peut 
25 etre par exemple effectuee de la maniere suivante : 

a) acquisition de Timage a Tinstant t, 

b) synchronisation spatiale, 

c) identification de la position des images "I" dans le^groupe • 

damages GOP, 
30 d) detection des images de type "P", 

e) proposition de la structure finale du GOP : position et 
distance entre les images de type T, "P" et "B", et des valeurs de n et de m. j 

La presente invention presente un champ d'application 

etendu. 

35 Dans plusieurs applications dans lesquelles des sequences; 

numeriques sont codees par les techniques recommandees de reduction de 
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debit, il est necessaire d'effectuer des synchronisations spatiales et/ou 
temporelles par rapport a une video numerique codee de reference. Comme 
exemples peuvent etre cites ici des applications de mise en cascade de 
codeurs ou certaines methodes automatiques devaluation de la qualite 
5 damage. 

En effet, dans le premier cas de figure, la synchronisation 
apporte une optimisation des performances de I'operation en terme de qualite 
finale des signaux video codes et restitues en fin de chaTne. L'absence de 
synchronisation peut mettre en echec la mise en cascade par la degradation 
10 definitive et non acceptable par les utilisateurs de la qualite des signaux 
cod6s et decodes. 

Pour la seconde application, certaines methodes devaluation 
necessitent le calcul d'un signal d'erreur issu du calcul de la difference entre 
deux signaux : le signal original code et diffuse en debut d'une chaTne de 
15 transmission, et le signal degrade obtenu en fin de chaTne. Dans ce cas la 
encore, la realisation de la synchronisation permet d'assurer un calcul efficace 
du signal d'erreur. 

Dans le present memoire, ont ete decrites des procedures de 
synchronisation spatiale et temporelle. Elles se declinent suivant une 
20 methode spatiale applicable pour le re-cadrage de I'image au pixel pres et/ou 
un procede de correction du dephasage horizontal d'un sous-pixel. 

La methode temporelle est utilisee pour identifier la structure 
du groupe d'images tel qu'il a ete defini par la normalisation MPEG2. Cette 
methode permet de detecter les images de type "I", "P" et "B M . De cette 
25 maniere, la syntaxe des groupes d'images GOP est determinee. Le procede 
selon Tinvention presente une grande robustesse aux bruits et aux variations 
du contenu de Timage. II demontre, par consequent, une grande efficacite 
pour Tanalyse des donnees utilisees par les techniques de codage. U trouve 
son application dans des equipements manipulant des donnees d'images 
30 numeriques et codees. 

En particulier, il permet d'effectuer une mise en cascade des 
equipements, une synchronisation spatiale au pixel pres ou a une fraction de 
pixel pres etant mise en oeuvre entre chaque operation de la mise en 
cascade. 

35 L'invention peut etre mise en oeuvre a Paide d'une 

transformee lineaire et orthogonale. Outre les exemples deja cites, cette 
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transformee peut etre une transformee en sinus discrete, une transformee de 
Haar, une transformee de Hadamar ou bien encore une transformee de Slant. 
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REVENDICATIONS 

1. Procede de synchronisation de la position spatiale d'une 
image video pour retrouver la position d'une grille initiate de codage 
numerique, par blocs de codage de ladite image, caracterise en ce qu'il met 

5 en oeuvre ies etapes suivantes : 

a) deplacer selon la direction des lignes de I'image et/ou 
selon la direction perpend iculaire aux lignes de 1'image, une grille d'analyse 
GA constitute de dits blocs de codage et correspondant a au moins une 
partie de Timage ; 

10 b) determiner a chaque position de la grille d'analyse GA, Ies 

coefficients transformes Fu.v de chaque bloc de la grille d'analyse GA, par 
une transformee par blocs ; et calculer pour chaque position de la grille 
d'analyse GA, un parametre d'activite representatif de I'activite de I'image ; 

c) determiner la position de la grille d'analyse GA pour 

15 laquelle ledrt parametre d'activite represente une activite minimale et valider 
ladite position en tant que position de synchronisation. 

2. Procede selon la revendication 1, caracterise en ce que 
ledit parametre d'activite est la moyenne AM des activites asb des blocs de la 
grille d'analyse, I'activite asb d'un bloc etant definie comme etant une 

20 combinaison eventuellement ponderee des valeurs absolues des coefficients 
transformes Fu,v, par ladite transformee par blocs avec (u,v) * (0,0), selon la 

formule suivante : ^ = y |jk <lltV) . F(llfV) |' 

(«,v>(aoV 

k(u,v) est un coefficient de ponderation de la composante utilisee, et p une 
25 constante. 

3. Procede selon la revendication 1 caracterise en ce que 
ledit parametre d'activite est la moyenne ES des entropies spectrales esb des 
blocs de la grille d'analyse 

avec : ES = esb, 

30 . 

esb = - X k(u,v). p(u,v)log 2 \(p(u*v))\ 

(«.v'K(o.o) 1 \ F(u,vf 

avec a^= X \k(u,v). F(u,v)\ p et p(u,v) = - — 

35 k(u,v) est un coefficient de ponderation de la composante utilisee, et p une 
constante. 



BNSDOCID: <FR 2769452A1_I_> 



2769452 



28 

4. Precede selon la revendication 3 caracterise en ce que : 

ZH"^)loS:[(M»^))]. ou^(«,v) = l^^ 

(<j.»HO.O) CLSD 

et 

iu.v)m(O.Q) 

F(u,v) designant les coefficients transformes d'un seul bloc, 
par ladite transformee par blocs. 

5. Procede selon une des revendications precedentes, 
10 caracterise en ce que ledit deplacement de la grille d'analyse s'effectue par 

pas egaux a une distance inter-pixels ou a un multiple de celle-ci. 

6. Procede selon une des revendications 1 a 4, caracterise en 
ce que ledit deplacement de la grille d'analyse s'effectue par pas inferieurs a 
une distance inter-pixels. 

15 7. Proc6d6 selon une des revendications precedentes, 

caracterise en ce que ladite position n'est validee a I'etape c que si ladite 
activite minimale que represente ledit parametre d'activite est superieure a un 
seuil donne A. 

8. Procede selon une des revendications precedentes, 
20 caracterise en ce qu'il comporte, avant i'etape a, une etape de conversion 
analogique-numerique a Taide d'un convertisseur presentant une horioge 
d'echantillonnage pour echantillonner des signaux d'images, et en ce qu'il 
comporte, apres I'etape c : 

- une etape d de decalage dX de la grille d'analyse dans le 
25 sens des lignes de Timage, en modifiant d'au moins un increment dcp la phase 

d'echantillonnage des signaux d'image ; 

- une etape e de determination, pour au moins une position 
decalee dX de la grille d'analyse, definie lors de I'etape d, desdits coefficients 
transformes Fu,v et dudit parametre representatif de I'activite de I'image. 

30 9. Procede selon la revendication 8, caracterise en ce que 

lors de I'etape d, on realise une scrutation dite sub-pixel en decalant la grille 
d'analyse selon une plurality de dites positions decalees de la grille d'analyse, 
qui sont obtenues en modifiant par increments d<p la phase d'echantillonnage, 
en ce que, lors de I'etape e, on determine, pour chacune des positions 

35 decalees, lesdits coefficients transformes Fu.v et ledit parametre d'activite 
representatif de I'activite de Timage, et en ce qu'il comporte une etape f de 
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determination de !a position dite sub-pixel (d<p 0 , dXo) de la grille d'analyse pour 
laquelle ledit parametre d'activite represente une valeur minimale de I'activite. 

10. Procede selon une des revendications 8 ou 9, caracterise 
en ce qu'ii comporte, apres reiape e, une etape g de determination dud it 

5 parametre d'activite selon deux dites positions decalees, dont Tune est une 
position dite avancee (dX+A) et I'autre est une position dite retardee (dX-A). 

11. Procede selon la revendication 10, caracterise en ce qu'il 
comporte apres I'etape g, une etape h de determination pour chacune des 
positions, avancee (dX+A) et retardee <dX-A), de la moyenne du parametre 

10 d'activite sur M images. 

12. Procede selon la revendication 11, caracterise en ce qu'il 
met en oeuvre un pilotage de la contre-reaction sur la phase <p de 
rechantillonnage a partir d'un signal d'erreur qui est la difference entre ladite 
moyenne du parametre d'activite pour la position retardee (dX-A) et ladite 

15 moyenne du parametre d'activite pour la position avancee (dX+A). 

13. Procede selon la revendication 12, caracterise en ce que 
ledit parametre d'activite est I'entropie spectrale et en ce que ledit signal 
d'erreur est normalise par I'entropie spectrale moyenne ES d'au moins une 
zone de I'image. 

20 14. Procede selon une des revendications precedentes, 

caracterise en ce qu'il comporte une etape de determination, dans une 
sequence d'images synchronises spatialement des images presentant les 
valeurs les plus faibles de I'activite representee par ledit parametre d'activite, 
ces images etant de ce fait identifies comme etant du type codees sans 

25 prediction I. 

15. Procede selon une des revendications precedentes, 
caracterise en ce qu'il comporte une etape de determination, dans une 
sequence d'images, des images presentant pour un parametre d'activite, de 
preference Tactivite moyenne AM, d'au moins une zone des images de ladite 

30 sequence, des valeurs correspondant a I'activite la plus elevee, ces images 
etant de ce fait identifiees comme etant du type P. 

16. Procede selon les revendications 14 et 15, caracterise en 
ce qu'il comporte une etape de caracterisation de la syntaxe du groupe 
d'images (GOP). 

35 17. Procede selon les revendications 14 a 16, caracterise en 

ce qu'une dite determination s'effectue apres filtrage passe-haut du signal 
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representatif du parametre d'activite des images de ladite sequence d'image, 
de maniere a eliminer au moins partiellement revolution du contenu des 
images a I'interieur de la sequence. 

18. Procede selon la revendication 17, caracterise en ce que 
5 ledit filtrage passe-haut consiste a calculer chaque point du signal filtre par 

calcul du plus petit ecart positif entre un point correspondent du signal non 
filtre et les points voisins correspondant a I'image precedente et a I'image 
suivante. 

19. Procede selon une des revendications precedentes 
10 caracterise en ce que ladite transformee par blocs est une transformee 

Iin6aire et orthogonale. 
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